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摘要 : 小 学 生 处 于 学 会 阅读 的 关键 期 ， 其 语言 和 认 知 成 长 需要 大 量 难度 适宜 、 利 于 理解 的 阅读 材料 。 
当前 的 阅读 分 级 主要 采用 字 、 词 、 句 等 浅 表层 面 的 量化 文本 指标 ， 较 难 适 应 汉语 表意 性 等 特点 和 儿 
童 认 知 发 展 需求 本 研究 首先 采用 元 分 析 等 方法 ， 归 纳 和 筛选 出 文体 、 主 题 、 角 色 、 人 情节、 语言 特 
点 、 文 本 结构 、 文 化 知识 以 及 生活 经 验 8 个 质 性 分 级 指标 ， 然 后 在 国际 上 首次 采用 SOLO 分 类 评价 
法 来 为 每 个 指标 制定 契合 儿童 认 知 发 展 结构 的 等 级 水 平 描述 ， 最 终 形 成 《汉语 儿童 读物 的 质 性 分 级 
标准 》 及 操作 手册 .进一步 的 实证 实验 结果 说 明 ， 该 分 级 标准 具有 较 高 的 区 分 效果 、 评 分 者 一 致 性 
信 度 和 预测 效 度 ， 能 够 客观 稳定 和 科学 可 靠 地 评估 儿童 读物 的 文本 复杂 性 . 综 上 ， 此 标准 可 有 助 于 
教师 、 出 版 编辑 和 家 长 评估 儿童 读物 的 适用 年 级 ， 利 用 汉语 分 级 阅读 来 促进 儿童 语言 与 认 知 发 展 ， 

实现 独立 阅读 ， 
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对 处 于 阅读 关键 期 的 小 学 生来 说 ， 分 级 阅读 被 公认 为 是 一 种 因材施教 、 章 有 成 效 、 值 得 推广 的 
阅读 教育 体系 上 。 大 量 研究 揭示 ， 难 度 适 宜 的 阅读 材料 能 作为 儿童 阅读 能 力 发 展 的 关键 脚手架 ， 利 
于 培养 儿童 的 阅读 技能 、 策 略 、 专 注 力 和 习惯 中。 因此 ， 我 国 统 编 版 小 学 语文 教科 书 和 教育 部 基础 
教育 课程 教材 发 展 中 心 发 布 的 《中 小 学 生 阅读 指导 目录 (2020 年 版 )》 等 均 体现 了 阅读 分 级 理念 ， 倡 
导 应 根据 不 同学 生 的 情况 ， 适 时 推荐 文化 品位 较 高 、 难 易 程 度 适当 的 课外 读物 B41 

调查 显示 ， 尺 管 我 国 少年 儿童 的 阅读 需求 强劲 ， 每 年 新 出 版 的 少年 儿童 读物 超 2 万 余 种 ， 但 是 
大 量 童 书 存在 “缺少 适 读 推荐 、 适 读 范围 过 宽 、 适 读 类 型 僵化 、 推 荐 年 龄 错误 ”等 问题 。 这 是 因为 我 
国 阅读 教育 中 缺乏 一 套 科 学 、 人 全面、 本 土 化 的 阅读 分 级 标准 ， 仪 有 出 版 机 构 和 研究 机 构 提 出 的 一 些 
初步 规范 I， 因 此 较 难 发 挥 出 对 儿童 阅读 的 有 效 指导 和 教育 价值 。 因 此 ， 吸 需 建立 符合 中 国 儿童 特 
点 的 读物 分 级 标准 ， 以 开展 和 推广 我 国 儿童 读物 的 分 级 ， 助 力 引 导 学 生 的 阅读 发 展 . 

一 、 阅 读 分 级 
(一 ) 当前 阅读 分 级 的 现状 与 不 足 

当前 ， 阅 读 分 级 研究 集中 在 对 文本 可 读 性 的 量化 分 析 领 域 ， 其 原理 为 借助 自然 语言 处 理 (natural 
language processing, NLP) 技术 来 自动 测量 单词 、 句 子 、 结 构 等 层面 的 文本 指标 ， 并 通过 公式 模型 
来 估计 文本 的 可 读 性 (readability)! 如 著名 的 蓝 思 公式 将 词 频 、 句 长 指标 作为 文本 难度 的 衡量 标准 。 
我 国 研究 者 也 发 现 ， 汉 字 种 、 词 种 难度 和 虚词 比例 可 作为 小 学 汉语 课文 册 数 的 最 佳 预测 指标 外 .此 
类 可 读 性 模型 实施 便利 ， 能 较 好 地 估计 因 字 词 难 度 产 生 的 阅读 认 知 负荷 ， 已 在 教材 编写 、 童 书 编辑 
和 出 版 等 领域 得 到 了 较为 广泛 的 应 用 中， 

然而 ， 传 统 的 量化 分 析 法 几乎 完全 依赖 于 可 被 自动 提取 的 浅 层 、 微 观 语言 特征 ， 仅 能 解决 “可 读 
性 ?问题 ， 难 以 应 对 儿童 读物 的 “复杂 性 ?问题 。 多 种 语言 的 研究 发 现 ， 语 言 作 品 的 阅读 难度 不 仅 在 于 
字 、 词 、 句 等 浅 表 层面 的 解码 (decoding) ， 更 在 于 其 所 绚 含 的 情节 发 展 、 思 想 深 度 、 文 化 底 蔓 等 宏 
观 层面 的 理解 (comprehension) 00。 相 较 于 从 字 、 词 、 句 中 获取 语义 信息 ， 研 究 者 普遍 认为 文本 理 
解 需要 读者 进行 推理 、 类 比 、 审 辨 、 反 思 等 复杂 加 工 00， 这 种 积极 的 意义 建构 过 程 对 儿童 认 知 和 语 
言 发 展 至 关 重要 。 同时， 文本 复杂 性 也 并 不 绝对 ， 而 是 相对 于 儿童 自身 的 背景 知识 和 生活 经 验 来 变 
化 的 ， 会 因 语言 、 认 知 、 心 理发 展 水 平和 阅读 任务 而 产生 不 同 的 理解 层次 。 因 此 ， 在 对 文本 可 读 性 
进行 量化 分 析 的 基础 上 ， 还 需要 针对 儿童 读物 的 复杂 性 进行 研究 ， 以 形成 全 面 的 和 系统 的 分 级 指标 
体系 。 

此 外 ， 由 于 汉语 的 特殊 性 ， 针 对 浅 表 层面 解码 的 量化 指标 对 汉语 阅读 分 级 的 适用 性 较 差 。 这 是 
因为 汉语 是 一 种 高 度 完备 的 表意 文字 ， 其 表意 性 体现 在 汉字 的 形 劳 部 件 能 规则 化 地 传达 语义 信息 ， 
形成 “ 触 类 旁 通 ” “举一反三 ”的 阅读 效果 ， 进 而 降低 了 字 词 难度 对 汉语 阅读 理解 的 影响 93。 同时 ， 
作为 基本 意义 单元 的 汉字 能 较为 灵活 地 构成 词语 , 因而 仅 3500 常用 汉字 就 可 以 覆盖 日 常生 活 中 99% 
以 上 的 文字 03， 其 效 价 远 高 于 英语 词汇 (99% 覆 盖 率 需 认识 10000 词 左右 ) OFS), AIA TIE AH, 
仅 通过 字 词 难度 、 虚 词 比 例 等 量化 指标 来 预测 汉语 文本 可 读 性 对 中 高 年 级 文本 难度 预测 准确 率 不 高 ， 
司 时 普 适 性 (generality) 较 差 ， 即 量化 文本 指标 难以 在 新 的 语 料 中 保持 原 有 的 预测 力 由 ， 


可 


因此 ， 汉 语 儿 童 读物 阅读 分 级 的 指标 体系 须 在 量化 文本 指标 的 基础 上 ， 充 分 契合 汉语 特有 的 语 
言 特点 和 学 习 规 律 。 综 上 所 述 ， 我 们 提出 基于 文本 复杂 性 的 质 性 分 级 是 构建 完善 的 汉语 阅读 分 级 的 
关键 . 

(二 ) 汉语 儿童 读物 的 质 性 分 级 解决 方案 

研究 显示 ， 质 性 分 级 是 儿童 读物 复杂 性 问题 的 有 效 解决 方案 。 质 性 分 级 的 原理 是 由 审慎 的 读者 
按照 一 定 的 标准 或 规则 ， 对 图 书 的 文本 特征 和 适用 对 象 进行 评级 的 分 析 方 法 09。 这 种 由 教师 、 编 辑 
及 家 长 们 对 书籍 难度 进行 质 性 估量 的 方法 具有 广泛 的 应 用 ， 如 美国 共同 核心 州立 标准 (CCSS) 中 的 
文本 复杂 度 评估 [0、 新 英格兰 共同 评估 (NECAP) 08、 美 国 大 学 入 学 考试 (ACT) nH、 中 国 中 小 学 
英语 分 级 阅读 项 目 上 以 及 上 海 市 中 小 学 汉语 分 级 阅读 标准 研制 项 目 加 等 ， 都 将 质 性 评估 纳 人 了 分 级 
阅读 教育 体系 中 。， 

和 量化 分 析 常 使 用 的 字 、 词 、 句 等 文本 指标 不 同 ， 质 性 分 级 关注 书籍 的 主题 内 容 、 思 想 深度 、 
文本 结构 、 背 景 知识 需求 等 更 为 深层 的 语言 特征 。 这些 语言 特征 目前 难以 通过 NLP 自动 提取 ， 需 通 
过 标准 化 的 质 性 分 析 范 式 来 主观 评估 。 例 如 ，CCSS 采用 的 量规 与 样 例 (rubrics and exemplars) 法 将 
这 些 指 标 放置 在 一 个 连续 量 太 上 ， 量 尺 的 一 端 是 特征 的 初级 水 平 ， 另 一 端 是 复杂 和 高 级 的 水 平 ， 而 
量 尺 的 “刻度 ” 则 是 相应 指标 水 平 的 描述 和 文本 样 例 89。 此 类 质 性 评级 方法 实现 了 深层 次 语言 特征 的 
判定 ， 其 标准 化 范式 提升 了 质 性 方法 的 客观 性 ， 为 读者 的 主观 判断 提供 了 销 定 依据 ， 

但 就 构建 汉语 阅读 分 级 的 指标 体系 而 言 ， 上 述 研究 存在 一 定 的 不 足 . 在 研究 对 象 方面 ， 上 述 研 
究 大 都 基于 英语 材料 或 汉语 课文 语 料 ， 缺 少 基 于 汉语 儿童 读物 的 研究 ， 指 标 体系 的 本 土 化 和 适用 性 
RAE. 在 研究 方法 上 ， 相 关 研 究 的 指标 选取 和 等 级 水 平 的 界定 仅 基 于 评审 者 的 个 人 主观 经 验 ， 存 在 
上 标 等 级 模糊 、 不 易 评定 、 主 观 性 较 高 的 问题 。 在 效果 验证 上 ， 这 些 质 性 评估 往往 缺乏 信 效 度 检 验 ， 
进而 缺少 可 信和 度 和 可 重复 性 等 证 据 20. 

此 外 ， 如 何 让 阅读 分 级 反映 儿童 的 语言 、 思 维 发 展 阶段 和 需求 也 是 一 个 不 容 忽视 的 问题 。 阅 读 
分 级 的 本 质 是 为 了 推荐 适合 儿童 最 近 发 展区 的 图 书 以 促进 儿童 的 独立 阅读 发 展 ， 则 汉语 阅读 分 级 的 
关键 科学 问题 不 只 是 选取 和 评估 文本 特征 ， 更 在 于 如 何 基于 儿童 语言 和 认 知 发 展 情况 来 预测 其 阅读 
各 类 书籍 的 学 习 效果 。 著 名 儿童 心理 学 家 皮 亚 杰 的 发 生 认 识 论 指出 ， 儿 童 的 认识 发 展 具 有 阶段 性 ， 
不 同 阶段 的 认 知 水 平 有 质 的 不 同 ， 对 某 种 特定 内 容 或 行为 的 学 习 ， 只 有 当 存 在 相应 的 结构 时 才能 发 
生 22。 而 比 格 斯 等 人 在 此 基础 上 提出 了 SOLO (structure of observed learning outcomes) 分 类 评价 法 ， 
进一步 将 儿童 对 具体 学 科 知识 、 学 习 活 动 的 认 知 过 程 概括 为 发 展 阶段 和 思维 结构 ， 即 前 结构 、 单 点 
结构 、 多 点 结构 、 关 联结 构 以 及 抽象 拓展 结构 中 。 大量 研究 证 实 ，SOLO 分 类 的 5 层次 思维 结构 可 
以 有 效 解 释 学 生 在 语文 .数学 、 科 学 等 多 学 科 任务 的 反应 水 平 , 进而 描述 学 生 认 知 发 展 的 普遍 规律 
可 以 作为 儿童 读物 分 级 的 理论 基础 。 因 此 ， 我 们 采用 SOLO 分 类 法 构建 质 性 文本 指标 的 等 级 水 平 描 
述 ， 以 自 上 而 下 地 从 儿童 认 知 结构 和 理解 能 力 的 角度 描述 文本 指标 的 层次 水 平 ， 进 而 解释 儿童 的 阅 
读 学 习 效果 和 内 因 ， 增 强 质 性 分 级 的 科学 性 和 教育 价值 . 
因此 ， 本 研究 广泛 调查 了 国内 外 教育 学 、 心 理学 、 儿 童 读物 出 版 等 领域 的 质 性 分 级 研究 和 实践 
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经 验 ， 通 过 元 分 析 归 纳 总 结 了 影响 汉语 文本 复杂 性 的 质 性 指标 ， 并 采用 SOLO 分 类 法 形成 了 各 项 指 
标的 标准 化 等 级 水 平 ， 最 终 研 制 了 一 套 《 汉 语 儿童 读物 分 级 的 质 性 评估 标准 》 (以 下 简称 《分 级 标 
准 》) 。 此 外 ， 我 们 还 采用 心理 测量 效 度 框架 开展 了 双 评 实验 ， 系 统 验 证 了 《分 级 标准 》 的 区 分 效 
果 、 评 分 者 一 致 性 信和 度 和 预测 效 度 ， 


二 、 研 究 方法 
(一 ) 研究 对 象 

本 研究 选取 了 150 本 质量 优秀 的 儿童 书籍 ， 来 自 教育 部 发 布 的 《中 小 学 生 阅 读 指 导 目 录 (2020 
年 版 )》 或 国内 教育 名 家 、 名 校 推 荐 两 次 以 上 的 小 学 分 级 阅读 书目 。 书目 中 不 仪 包含 中 外 各 类 优秀 
文学 作品 ， 还 加 入 一 定 比例 的 图 画 书 和 实用 作品 ， 如 介绍 自然 科学 、 人 文 社会 、 哲 学 、 艺 术 等 学 科 
的 普及 性 读物 。 这些 汉语 儿童 读物 都 具有 专家 论证 的 适宜 阅读 年 级 ， 因 此 我 们 将 适宜 阅读 年 级 的 均 
值 作为 读物 的 文本 复杂 性 等 级 ( 取 整 为 1-6 级 ) ， 作 为 儿童 读物 质 性 分 级 的 金 标准 ， 
(二 ) 质 性 分 级 标准 的 构建 

分 级 标准 的 构建 分 为 三 个 部 分 ， 指 标 初 般 、 初 评 实验 及 形成 标准 (图 1) . 


17 个 文本 指标 
逐一 细 化 ， 制 定 11 个 指标 


阅读 图 书 ， 围 绕 指标 撰写 评语 和 评分 


共 线性 检验 合并 相似 ， 保 留 8 个 指标 
构建 标准 制定 8 指标 的 等 级 水 平 描述 


形成 《汉语 儿童 读物 的 质 性 分 级 标准 》 


图 1 质 性 分 级 标准 的 构建 流程 

指标 初 第 .通过 分 析 教 育 学 、 心 理学 和 童 书 出 版 领域 的 相关 文献 ， 我 们 对 国内 外 的 主流 质 性 指 
标 体系 进行 归纳 ， 初 步 得 选 出 17 个 文本 指标 .采用 基于 团队 讨论 的 元 分 析 法 逐一 细 化 了 这 些 指标 的 
定义 和 内 涵 ， 制 定 了 容易 理解 、 切 实 可 评 、 与 文本 复杂 性 关联 较 大 的 11 个 指标 ， 

初评 实验 . 为 了 形成 符合 汉语 儿童 读物 特点 的 指标 等 级 ， 我 们 招募 13 名 审慎 的 读者 阅读 了 这 些 
儿童 读物 . 这 些 读者 需 分 别 围绕 这 11 项 指标 来 对 这 些 图 书 撰写 评语 ， 并 使 用 文中 的 内 容 和 细节 作为 
支撑 。 同 时 ， 我 们 还 鼓励 读者 按照 自己 的 感受 对 图 书 的 指标 水 平 打分 . 

形成 标准 . 在 初评 实验 结果 的 基础 上 , 我 们 通过 相关 分 析 检 验 出 了 存在 共 线 性 问题 (相关 >0.80) 
的 质 性 指标 . 为 了 减少 这 些 指标 含义 的 重合 , 我们 将 11 个 指标 梳理 合并 为 8 项 指标 ,， 即 文体 、 主题 、 
角色 、 情 节 、 语 言 特点 、 文 本 结构 、 文 化 知识 、 生 活 经 验 。 除 了 汇总 了 自 下 而 上 的 儿童 读物 指标 评 


语 ， 我 们 还 参考 SOLO 分 类 法 中 的 学 生 思 维 结构 来 自 上 而 下 地 归纳 学 生 阅读 各 级 读物 时 需要 的 认 知 
水 平 特点 ， 以 作为 这 些 指标 的 等 级 水 平 描述 。 综 上 ， 研 究 团队 撰写 了 《汉语 儿童 读物 的 质 性 分 级 标 
准 》 和 《汉语 儿童 读物 的 质 性 分 级 操作 手册 》. 
(三 ) 质 性 分 级 标准 的 实验 验证 

为 进一步 验证 《分 级 标准 》 的 客观 性 和 有 效 性 ， 本 研究 设计 了 儿童 读物 的 双 评 验证 实验 。 具 体 
来 说 ， 本 研究 招募 了 22 名 教育 心理、 中文、 文学 专业 的 语文 教师 、 出 版 从 业者 、 在 校 研究 生 和 高 
年 级 本 科 生 作为 评分 员 。22 名 评分 员 被 随机 分 为 11 组 ， 每 组 阅读 并 评价 18 本 相同 的 儿童 读物 ， 最 
终 形 成 191 对 评分 结果 (其 中 1 组 评分 员 仅 完成 11 本 书 的 双 评 ， 每 本 书 被 评价 2 -4 次 ) .评分 员 
在 完整 阅读 儿童 读物 后 ， 依 据 研究 者 提供 的 材料 《分 级 标准 》 和 《操作 手册 》 来 对 8 个 文本 指标 评 
分 (1-5 级) ， 并 撰写 具体 的 评分 理由 ， 

为 了 保证 评级 质量 ， 我 们 使 用 了 多 种 设置 来 控制 实验 的 干扰 因素 。 实 验 前 ， 研 究 者 对 全 部 评分 

行 了 集体 培训 ， 包 括 解读 打分 标准 及 指标 内 容 、 讲 解读 物 评分 样 例 、 现 场 练习 及 答疑 等 ， 确 保 
评分 员 充分 理解 评分 规范 及 流程 。 其 次 ， 评 分 员 需 完整 阅读 儿童 读物 后 才 可 以 评分 ， 且 需要 结合 读 
物 的 细节 来 撰写 打分 理由 ， 这 可 以 保证 评分 结果 是 客观 真实 的 。 最后， 评分 员 们 全 程 独立 完成 实验 ， 
既 不 知道 读物 的 阅读 难度 等 级 ， 也 不 清楚 其 他 人 的 待 评书 目 ， 这 可 以 保证 评分 结果 的 独立 性 ， 
(四 ) 数据 分 析 


本 研究 根据 11 组 评分 人 对 分 级 标准 中 难度 等 级 和 8 个 文本 指标 评分 结果 ， 使 用 SPSS 和 Python 
软件 进行 统计 分 析 ， 分 别 计算 了 每 组 评分 者 的 皮尔 逊 积 差 相 关系 数 和 斯 皮尔 曼 等 级 相关 系数 作为 评 
分 者 间 一 致 性 信 度 指标 ， 计 算 了 Cronbach alpha 系数 作为 评分 者 内 一 致 性 信 度 指标 。 此 外 ， 本 研究 
使 用 多 元 回归 来 估计 了 本 阅读 分 级 标准 的 预测 效 度 。 

三 、 结 果 
(一 ) 读物 复杂 性 的 质 性 分 级 指标 体系 

为 了 建立 一 个 全 面 、 有 效 的 文本 复杂 性 质 性 评估 指标 体系 ， 本 研究 首先 对 国内 外 的 代表 性 研究 
65612720 进 行 检索 和 分 析 ， 归 纳 了 用 语 不 同 但 内 涵 相 似 的 指标 (如 主题 、 内 容 等 ) ， 并 剔除 了 与 文本 
复杂 性 关联 不 紧密 或 不 易 评价 的 指标 (如 文本 长 度 、 写 作 手 法 、 播 图 特点 、 排 版 形式 等 ) 。 如 表 1 
所 示 ， 我 们 初步 形成 了 11 个 质 性 评估 指标 ， 篇 章 类 指标 包含 主题 内 容 、 人 物 角色 、 情 节 、 文 本 类 型 
/体裁 ， 语 言 类 指标 包含 词汇 、 句 子 结构 、 文 本 结构 、 语 言 常规 性 和 清晰 度 ， 背 景 知识 类 指标 包含 文 
化 知识 、 互 文 性 、 生 活 经 验 , 

我 们 采用 相关 分 析 检 验 了 这 些 指标 在 初评 实验 数据 中 的 共 线 性 ， 合 并 了 相关 系数 > 0.80 的 文本 
Hts, 即将 词汇 、 语 言 常规 性 和 清晰 度 、 句 子 结构 概括 为 语言 特点 ， 将 文化 知识 和 互 文 性 概括 为 文 
化 知识 。 由 此 ， 本 《分 级 标准 》 的 文本 复杂 性 指标 共 包含 3 个 方面 的 8 个 指标 。 这 些 指标 由 浅 人 深 
地 反映 了 儿童 读物 的 浅 表 语 言 特征 、 深 层 思想 特征 和 对 儿童 群体 的 认 知 、 心 理发 展 需求 ， 因 此 作为 
汉语 儿童 读物 分 级 的 主要 维度 . 


员 进 


表 1 汉语 儿童 读物 分 级 的 质 性 评估 指标 


一 级 指标 参考 指标 及 依据 最 终 指标 
文本 类 型 /体裁 (170 文体 
EMA AS17720) 主题 
篇 章 
KD fh 66701 角色 
情节 [620 睛 节 
词汇 [6.17,19] 
句子 结构 "0 语言 特点 
语言 
语言 常规 性 和 清晰 度 1179 
文本 结构 .1720 文本 结构 
文化 知识 07181 
文化 知识 
背景 知识 需求 互 文 性 [6201 
生活 经 验 [617] 生活 经 验 


(二 ) 汉语 儿童 读物 的 质 性 分 级 标准 


构建 好 文本 指标 后 ， 我 们 根据 SOLO 分 类 法 和 初评 中 的 儿童 读物 指标 评语 ， 为 每 个 指标 编制 


了 4-5 个 水 平 的 等 级 描述 (1 级 最 易 ，5 级 最 难 ) 。 例 如， 根据 SOLO 的 5 水 平 思维 结构 (前 结构 、 


单 点 结构 、 多 点 结构 、 关 联结 构 以 及 抽象 拓展 结构 ) ， 情 


重复 情节 ，3 连续 情节 ，4 多 情节 ，5 复杂 、 多 线索 1 


标准 》 ( 表 2) 。 


节 指 标的 5 个 水 平 依次 为 : 1 单 
青 节 。 由 此 最 终 形成 《汉语 儿童 读物 的 质 性 分 级 


情节 


T, 


2 


为 了 保证 读物 分 级 的 质量 ， 我 们 还 编制 了 《汉语 儿童 读物 的 质 性 分 级 操作 手册 》， 涵 盖 了 更 为 


详细 的 指标 介绍 、 


如 ， 我 们 发 现 评分 员 可 能 会 混 消 情 
作 手 册 》 中 界定 了 这 两 个 水 平 的 异同 : “重复 


评级 原则 、 注 意 事项 、 相 似 等 级 的 区 分 方法 、 常 见 问 题 以 及 评级 样 例 等 内 容 。 例 


标 中 的 水 平 2 (重复 情节 ) 和 水 平 3 (连续 


He +k 
HIB 


并 且 情 节 之 间 相 对 独立 或 有 一 定 重复 .后 者 的 情节 相互 衔接 、 弟 进 ， 


操作 手册 可 联系 研究 团队 获取 ， 


表 2 汉语 儿童 读物 的 质 性 分 级 标准 


青 节 ) ， 特 在 《 操 
青 节 与 连续 情节 都 具有 多 个 情节 。 前 者 的 连续 性 不 强 ， 


推动 故事 的 发 展 和 深入 ”。 完整 


指 水 平 1 水 平 2 水 平 3 水 平 4 IE 5 评 
标 | 前 结构 单 点 结构 多 点 结构 关联 结构 抽象 拓展 结构 ”分 
1. 图 画 书 ， 童 2. 童话 ， 寓 言 ， 含 简 3， 氢 事 性 文本 ， 4， 文 学 作品 ， 如 |5， 专 业 类 、 科 技 类 
SCH, JLK 单 的 标牌 、 图 示 等 的 | 如 故事 ， 短 篇 小 | 历史 故事 、 戏 剧 、| 说 明文 ， 议 论文 ， 传 
体 说 明 性 文字 ， Bis 图 文 结合 的 实 散 文 、 诗 歌 、 中 长 | 记 等 ， 

用 文 ， 简 单 说 明 篇 小 说 ， 纪 实 文 


X, PREX. 


ia ar 


章 。 


1. 简单 日 常 主 


2. 有 教育 意义 的 日 


3. 日 常 主题 + 少数 


4. 非 日 常 主题 : 有 


5. 社会 科学 类 非 日 


人 等 修辞 手法 ， 易 理 
解 。 


修辞 手法 ， 易 理 
解 . 


杂 、 多 变 ， 不 影响 


全 文 意义 的 理解 。 


题 : 日 常生 活 中 | 常 主题 ， 日常 生活 相 | 非 日 常 主题 婚 有 超出 个 人 经 历 和 ”| 常 主题 ， 社 会 类 (如 
的 主题 及 概念 ”| 关 ， 且 有 利于 积极 心 与 日 常生 活 相关 旧 常 生活 范围 的 ”| 社会 争议 、 人 文艺 
主 | (如 家 庭 、 动 态 、 习 惯 和 品质 形成 的 主题 也 有 少数 主题 出 现 ， 需 要 一 | 术 、 道 德 伦 理 等 ) 
g PAm WER (如 快乐 、 分 超出 日 常生 活 的 定 推理 能 力 才能 ”科学 类 (如 科普 百 
通 工 具 、 食 物 、| 享 、 Ate. BES) ,| 主题 (如 冒险 故 ”理解 的 抽象 主题 | 科 、 科 技 进 展 ) 以 及 
身体 、 颜 色 、 游 以 及 人 际 交 往 主题 E). (如 奇幻 、 探 险 、| 健 康 类 (如 家 庭 问 
RÆ). (如 亲友 、 师 生 、 陌 魔法 、 侦 探 等 ) . | 题 、 衰 老 与 死亡 、 身 
EKE). 心 障碍 等 ) 
fall. 简单 2. 较 简单 3. 较 复 杂 4. 复杂 多 面 5. 复杂 变化 、 象 征 化 
色 
情 |1. 单一 情节 ”|2. 重复 情节 3. 连续 情节 4. 多 情节 5. 复杂 、 多 线索 情节 
节 
1. 白话 , 词汇 简 2. 和 白话， 词汇 简单 且 3. 白话 , 词汇 有 一 4. 大 部 分 是 白话 , 5. 大 部 分 是 白话 , B 
单 且 口 语 化 ， 大 上 口语 化 ， 以 简单 口语 定 难 度 且 书面 化 ,| 以 描述 性 书面 语 | 面 化 难 词 、 长 句 较 
语 | 部 分 为 简单 句 ，| 叙 述 为 主 ， 大 部 分 为 | 侦 有 长 句 、 复 杂 的 | 为 主 ， 夹 杂 一 些 较 | 多 ， 句 子 结构 复杂 、 
言 韵律 感 强 ,， 语 言 简 单 句 ， 包 含 较 短 分 句子， 以 简单 书面 为 抛 口 、 星 梁 的 语 多 变 ， 多 处 出 现 较 复 
特 直 白 易 理 解 。 | 句 。 有 少量 不 影响 理 语 叙述 为 主 , SSH (如 文言 、 方 “| 杂 的 抽象 、 比 喻 (HR 
点 解 的 夸张 、 比 喻 、 拟 | 张 、 比 喻 、 拟 人 等 言 ) ， 句 子 结构 复 喻 ) 、 讽 刺 等 手法 ， 


使 全 文 意义 深刻 。 


a if y 


1. 结构 清晰 , 叙 
述 具有 重复 性 ， 
很 容易 预测 。 


2. 文本 结构 清晰 ， 按 
时 间或 事物 发 展 顺 序 
叙述 ， 较 容易 预测 。 


3. 包含 一 些 复杂 
结构 ， 按 时 间或 事 
物 发 展 顺序 叙述 ， 
较 容 易 预 测 。 


4. 叙述 方式 多 样 ， 
叙述 过 程 中 发 生 
时 间 转 换 ， 偶 尔 出 
现 较 难 预测 的 故 
事 走向 。 


5. 叙述 方式 多 样 , 叙 
述 过 程 中 发 生 时 间 
转换 ， 难 以 预测 故事 
走向 ， 


1. 包含 日 常 使 
用 知识 ， 不 涉及 
任何 历史 、 文 
化 、 学 科 专 业 知 


KR. 


2. 所 涉及 的 历史 、 文 
化 、 学 科 知 识 ， 为 日 
常生 活 中 可 了 解 的 常 


KR. 


3. 所 涉及 的 历史 、 
文化 、 学 科 知 识 有 
一 定 专业 性 ， 可 通 
过 阅读 上 下 文理 
解 . 


4. 所 涉及 的 历史 、 
文化 、 学 科 知 识 有 
一 定 专业 性 ， 需 要 
积累 一 定 阅读 经 
验 才能 理解 。 


5. 所 涉及 的 历史 、 文 
化 、 学 科 专 业 知 识 深 
奥 ， 脱 离 日 常生 活 ， 
有 较 大 理解 难度 ， 需 
查找 资料 来 辅助 理 
解 . 


1. 文 中 描述 的 是 
日 常生 活 经 历 
或 普遍 社会 经 


2. 文 中 描述 与 一 般 人 
日 常生 活 经 历 相似 ， 
少量 涉及 地 域 .文化 、 


3. 文 中 描述 与 一 般 
人 日 常生 活 经 历 
联系 较 少 ， 有 特殊 


4. 文 中 描述 与 一 般 
人 日 常生 活 经 历 
脱离 ， 有 独特 的 人 
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验 验 ， 如 衣食 住 
íT. LÆRK EZ 
生活 化 ， 好 理解 
的 情景 


年 代 差异 等 ， 或 因 奇 

J] 背景 产生 的 经 历 差 
异 ， 但 不 影响 整体 理 儿 
解 。 


的 人 生 经 历 或 社 
会 经 验 ， 大 部 分 内 
容 涉及 地 域 、 文 
化 、 年 代 等 差异 ， 
增加 了 理解 难度 。 


生体 验 和 深刻 感 
悟 ， 大 部 分 内 容 涉 
及 地 域 、 文 化 、 年 
代 等 差异 ， 增 加 了 
整体 理解 的 难度 . 


HE: 评分 为 1- 5 或 不 适用 ,虽然 
等 级 描述 或 有 不 足 、 不 符 之 处 ， 
注 中 注 明 不 适用 的 原因 ， 
(三 ) 质 性 分 级 标准 的 实验 验证 结果 

1. 评价 指标 的 区 分 效果 

读物 分 级 标准 可 评估 每 本 儿童 读物 在 8 个 指标 上 的 表现 ， 即 儿童 读物 的 多 维 画 像 。 因 此 ， 图 2 
呈现 了 每 个 指标 的 复杂 性 等 级 分 布 ， 来 作为 各 评价 指标 的 区 分 效果 。 结 果 显示 ， 随 着 指标 等 级 的 增 
加 ， 文 本 复杂 性 均 呈 现 出 明显 的 上 升 趋势 ， 说 明 这 8 项 质 性 指标 的 等 级 与 文本 复杂 性 均 呈 单调 递增 
关系 ， 即 简单 的 儿童 读物 的 质 性 指标 等 级 较 低 ， 复 杂 的 儿童 读物 的 质 性 指标 等 级 较 高 ， 表 明 质 性 指 
标 对 文本 复杂 性 具有 较 高 的 区 分 效果 . 另外， 评分 结果 中 的 文体 、 语 言 特点 、 生 活 经 验 等 指标 被 评 
为 不 适用 的 次 数 <1 次 ， 而 不 适用 比例 相对 最 高 的 指标 为 角色 ( 仅 为 2.3%) 、 情 节 (DON 1.8%) 
说 明 各 项 指标 的 描述 贴切 、 适 用 性 较 强 ， 可 以 较 好 地 评估 儿童 读物 的 特点 ， 


上 述 指标 及 等 级 描述 已 被 多 次 修订 , 但 由 于 儿童 读物 内 容 丰 富 
因此 ， 我 们 允许 评分 者 在 评估 指标 水 平时 填写 “不 适用 ”， 但 需 在 备 
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注 : 误差 棒 为 标准 误 的 95% 置 信 区 间 ， 可 用 于 直观 比较 指标 等 级 在 文本 复杂 性 上 的 差异 显著 性 . 
图 2 质 性 分 级 指标 与 文本 复杂 性 的 关系 
2. 评分 者 一 致 性 信 度 
为 验证 质 性 分 级 标准 的 客观 性 ， 本 研究 估计 了 11 组 评分 结果 的 评分 者 间 一 致 性 信和 度 (R 3) 
各 项 指标 的 平均 皮尔 逊 积 差 相关 为 0.71， 平 均 斯 皮尔 曼 等 级 相关 为 0.71， 均 说 明 两 位 评分 者 参照 同 
一 分 级 标准 评估 儿童 读物 的 各 项 指标 时 ， 所 得 结果 的 一 致 程度 较 高 ， 评 分 结果 具有 较 高 的 客观 性 ， 


另外 , 8 项 指标 的 Cronbach alpha 信和 度 达 到 了 0.95, 说 明 各 项 指标 结果 的 评分 者 内 一 致 性 信 度 也 较 高 。 
表 3 双 评 实验 中 各 项 指标 的 评分 者 间 一 致 性 信 度 


指标 皮尔 逊 积 差 相 关 斯 皮尔 曼 等 级 相关 
文体 0.77 0.77 

主题 0.65 0.62 

角色 0.67 0.68 

情节 0.73 0.71 
语言 特点 0.77 0.80 
文本 结构 0.72 0.72 
文化 知识 0.68 0.63 

生活 经 验 0.71 0.71 

平均 0.71 0.71 


3. 效 度 验证 

最 后 ， 为 了 验证 分 级 标准 的 预测 效 度 ， 本 研究 采用 多 元 回归 法 来 探索 每 本 儿童 读物 的 平均 文本 
指标 水 平 对 其 复杂 性 的 预测 效 度 .结果 显示 多 元 回归 模型 显著 , 具体 经 验 公式 为 : 文本 复杂 性 = 0.34x 
文体 - 0.25x 主 题 + 0.17x 角 色 - 0.04x 情 节 + 0.31x 语 言 特点 + 0.41x 文 本 结构 + 0.26x 文 化 知识 + 
0.33x 生 活 经 验 - 0.12. 此 模型 预测 值 对 文本 复杂 性 的 解释 率 达 到 了 71.5%, F(8,141) = 43.67 ,P< 0.001, 
说 明 指 标 体系 对 文本 复杂 性 具有 良好 的 预测 效 度 .另外 ,我 们 发 现 当 增 加 对 一 本 书 的 评价 者 人 数 时 ， 
回归 模型 的 解释 性 会 有 明显 的 提升 。 这 表明 质 性 评级 的 主观 性 还 可 以 通过 增加 评分 者 人 数 来 降低 . 


四 、 讨 论 

汉语 儿童 读物 的 分 级 具有 较 高 的 教育 和 应 用 价值 。 为 了 解决 儿童 阅读 分 级 研究 中 量化 文本 指标 
浅 表 、 忽 视 儿 童 认 知 发 展 需求 等 不 足 之 处 ， 本 研究 毕 合 国内 外 相关 研究 ， 采 用 元 分 析 归 纳 和 筛选 出 
由 浅 至 深 的 多 层次 质 性 指标 .在 此 基础 上 ， 研 究 在 国际 上 首次 采用 SOLO 分 类 评价 法 来 编制 符合 儿 
童 认 知 发 展 结构 的 等 级 水 平 描述 ， 编 制 了 《汉语 儿童 读物 的 质 性 分 级 标准 》 及 操作 手册 .进一步 实 
验 结果 显示 ，《 分 级 标准 》 及 文本 指标 具有 和 较 好 的 区 分 效果 、 评 分 者 一 致 性 信和 度 和 预测 效 度 ， 能 够 
作为 分 级 阅读 教育 和 出 版 的 有 效 工 具 和 科学 保障 。 简 言 之 ， 本 分 级 标准 较 好 地 综合 了 影响 阅读 复杂 
性 的 深层 次 指标 ， 可 用 于 形成 大 规模 分 级 读物 库 ， 助 力 教师 、 家 长 和 出 版 从 业者 推广 分 级 阅读 教育 ， 
以 科学 推动 、 整 体 提高 儿童 阅读 能 力 ， 

通过 综合 参考 和 整理 多 项 国内 外 儿童 读物 质 性 分 级 研究 ， 本 研究 采用 元 分 析 法 归纳 和 分 析出 8 
个 适用 于 汉语 儿童 读物 的 分 级 指标 ， 即 篇 章 层 面 的 文体 、 主 题 、 角 色 、 人 情节 指标 ， 语 言 层 面 的 语言 
特点 、 文 本 结构 指标 ， 以 及 背景 知识 需求 层面 的 文化 知识 、 生 活 经 验 指标 。 这 些 指标 较为 综合 地 反 
映 了 儿童 读物 中 的 语 篇 特征 、 深 层 思想 特征 和 对 儿童 群体 的 认 知 、 心 理发 展 需求 ， 能 够 客观 、 稳 定 
地 预测 儿童 读物 的 复杂 性 等 级 。 研究 结果 支持 了 建构 整合 模型 (construction-integration model) P3 


的 观点 ， 即 阅读 理解 的 心理 表征 包含 建构 过 程 (自动 激活 文本 信息 和 读者 的 相关 背景 知识 ) 和 整合 
过 程 (人 脑 中 会 大 量 激活 相关 概念 的 联结 ， 同 时 抑制 无 关 或 弱 相 关 概 念 的 联结 ) 。 这 两 种 过 程 会 反 
复 交 互 来 形成 整体 的 理解 ， 即 文本 思想 和 背景 知识 的 有 效 联结 。 因 此 ， 本 研究 较 好 地 解决 了 基于 字 
词 解码 等 自动 化 特征 的 量化 研究 难以 真正 解释 儿童 遇 到 的 阅读 困难 ， 也 较 难 给 出 有 针对 性 、 有 价值 
的 阅读 提升 建议 的 问题 。 同 时 ， 本 研究 筛选 出 的 8 个 质 性 指标 不 但 可 作为 文本 复杂 性 的 有 效 维度 ， 
还 可 作为 语言 学 量化 研究 的 对 象 *27 和 教学 策略 的 参考 , 为 文本 复杂 性 向 实证 应 用 提供 新 的 研究 视 
Fi. 

与 前 人 研究 不 同 的 是 ， 本 研究 在 国际 上 首次 应 用 SOLO 分 类 法 来 制定 出 指标 的 等 级 水 平 描述 。 
实验 结果 显示 8 个 指标 的 等 级 均 具 有 循序 渐进 、 逐 步 发 展 的 特点 ， 说 明基 于 SOLO 分 类 法 形成 的 等 
级 描述 确实 刻画 了 儿童 读物 复杂 性 的 普遍 阶段 和 结构 ， 增 强 了 质 性 指标 对 读物 复杂 性 的 区 分 效果 ， 
同时 ， 从 学 习 角度 来 说 ， 应 用 SOLO 分 类 法 的 分 级 标准 更 符合 儿童 的 语言 和 认 知 发 展 规律 ， 可 以 解 
释 学 生 在 阅读 任务 上 的 外 部 结果 和 内 部 原因 。 更 为 重要 的 是 ， 有 研究 指出 SOLO 分 类 法 还 能 够 将 学 
生 认 知 发 展 阶 段 和 学 习 循 环 特征 联系 起 来 ， 诊 断 学 生 当 前 水 平和 教学 目标 的 差距 针 。 因 此 ，SOLO 
分 类 法 或 许 还 是 在 阅读 教学 中 创设 最 近 发 展区 、 构 建 形 成 性 测评 的 有 效 手 段 . 

在 指标 得 选 、 等 级 水 平 描述 两 个 环节 的 基础 上 ， 本 研究 最 终 编制 了 《汉语 儿童 读物 的 质 性 分 级 
标准 》 及 操作 手册 . 考虑 到 以 往 的 质 性 分 级 指标 体系 存在 缺少 有 效 性 证 据 的 问题 ， 本 研究 实施 了 严 
说 的 双 评 实验 ， 发 现 良好 的 评分 者 间 一 致 性 信和 度 、 评 分 者 内 一 致 性 信和 度 和 预测 效 度 ， 说 明 本 分 级 标 
准 能 够 提供 客观 可 靠 、 科 学 有 效 的 分 级 结果 ， 具 有 较 高 的 可 操作 性 . 这 些 发 现 可 以 推动 教师 、 出 版 
从 业 人 员 等 使 用 者 在 出 版 和 教学 实践 中 广泛 应 用 分 级 阅读 。 例 如 ， 阅 读 分 级 标准 可 作为 推广 分 级 阅 
读 的 科学 参考 和 教学 工具 ， 让 教师 参考 本 分 级 标准 来 为 学 生 制 定 阅 读书 单 、 形 成 分 级 书库 ， 让 儿童 
读物 出 版 行业 规范 儿童 读物 的 制作 和 评价 流程 ， 产 出 符合 儿童 认 知 发 展 和 阅读 需求 的 分 级 读物 ， 

当前 的 研究 还 存在 许多 未 尽 之 处 ， 比 如， 儿童 读物 的 可 读 性 和 复杂 性 是 文本 相对 独立 的 两 个 属 
性 ， 因 而 一 个 更 完善 的 汉语 儿童 读物 分 级 体系 应 该 是 质 性 和 量化 指标 及 分 析 的 有 机 结合 . 因此 ， 下 
一 步 工作 应 当 研究 这 两 类 指标 的 关系 ， 并 将 其 融 为 一 体 ， 形 成 更 为 全 面 、 精 准 的 分 级 指标 体系 .第 
二 ， 相 较 于 量化 分 级 的 高 信和 度 、 低 成 本 ， 质 性 分 级 中 难免 存在 评分 员 主 观 性 、 耗 时 耗 力 等 问题 。 但 
随 着 GPT - 328 和 清 源 中 文 预 训练 模型 CPMP9 等 自 回 归 语 言 模型 的 提出 , 神经 网 络 模型 的 文本 理解 、 
知识 概括 、 文 本 生成 能 力 得 到 了 进一步 提升 ， 对 汉语 儿童 读物 中 深层 次 认 知 指标 的 自动 提取 、 大 规 
模 儿 童 读物 自动 分 级 都 已 成 为 可 能 。 因 此， 如 何 利用 超大 规模 的 NLP 模型 来 完成 汉语 儿童 读物 的 自 
动 分 级 将 是 下 一 步 研 究 的 重要 方向 。 


au 
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Qualitative Grading Standard for Chinese Children's Books 


Abstract: Elementary school students are at a critical stage of learning to read, and their language ability 
and cognitive development require a large amount of reading materials that are appropriately difficult and 
conducive to comprehension. Current leveled reading mainly relies on shallow and quantitative text 
indicators, such as characters, words, and sentence level lexical properties, which is less suitable for the 
characteristics of Chinese ideographs and children's cognitive development needs. This study first used 
meta-analysis to glean eight qualitative cognitive indicators, including genre, theme, character, storyline, 
language feature, text structure, background knowledge, and life experience. Then we used the SOLO 
taxonomy to develop a standardized grading description for each indicator that satisfied the developmental 
stages of children’s cognitive ability. Finally, we constructed the Qualitative Grading Standard for Chinese 
Children’s Books and its operation manual. The follow-up empirical study showed that the qualitative 
indicators had high discriminability, raters’ consistency reliability and predictive validity, and thus could be 
used to evaluate children’s books in an objective, reliable and valid way. In short, our Standard will help 
school teachers, book editors, and parents determine the appropriate grade level for children's books and 
use Chinese leveled reading to promote children's language and cognitive development so that they can 
achieve independent reading as early as possible. 


Keywords: leveled reading; children's books; text complexity; qualitative indicators; SOLO taxonomy 


